NVIDIA突破4位浮点训练瓶颈:让大模型训练速度翻倍的NVFP4技术
这项由NVIDIA团队在2025年9月发表的研究,标志着大型语言模型训练精度优化的重要突破。论文详细介绍了NVFP4格式及其配套训练方法,有兴趣深入了解的读者可以通过arXiv:2509.25149查询完整论文。
这项由NVIDIA团队在2025年9月发表的研究,标志着大型语言模型训练精度优化的重要突破。论文详细介绍了NVFP4格式及其配套训练方法,有兴趣深入了解的读者可以通过arXiv:2509.25149查询完整论文。
这项由微软亚洲研究院的龚也筠和程鹏等研究人员领导的开创性研究发表于2025年在加拿大温哥华举行的第42届国际机器学习会议(ICML)。有兴趣深入了解的读者可以通过论文地址 arXiv:2501.17116v2 访问完整论文。